智能论文笔记

Developing neural machine translation models for Hungarian-English

Attila Nagy

分类：自然语言处理 | 机器学习

2021-11-07

我用Hunglish2语料库训练神经电脑翻译任务的模型。这项工作的主要贡献在培训NMT模型期间评估不同的数据增强方法。我提出了5种不同的增强方法，这些方法是结构感知的，这意味着而不是随机选择用于消隐或替换的单词，句子的依赖树用作增强的基础。我首先关于神经网络的详细文献综述，顺序建模，神经机翻译，依赖解析和数据增强。经过详细的探索性数据分析和Hunglish2语料库的预处理之后，我使用所提出的数据增强技术进行实验。匈牙利语的最佳型号达到了33.9的BLEU得分，而英国匈牙利最好的模型达到了28.6的BLEU得分。

translated by 谷歌翻译

MERLIN: Multi-agent offline and transfer learning for occupant-centric energy flexible operation of grid-interactive communities using smart meter data and CityLearn

Kingsley Nweye , Siva Sankaranarayanan , Zoltan Nagy

分类：机器学习 | 人工智能

2022-12-31

The decarbonization of buildings presents new challenges for the reliability of the electrical grid as a result of the intermittency of renewable energy sources and increase in grid load brought about by end-use electrification. To restore reliability, grid-interactive efficient buildings can provide flexibility services to the grid through demand response. Residential demand response programs are hindered by the need for manual intervention by customers. To maximize the energy flexibility potential of residential buildings, an advanced control architecture is needed. Reinforcement learning is well-suited for the control of flexible resources as it is able to adapt to unique building characteristics compared to expert systems. Yet, factors hindering the adoption of RL in real-world applications include its large data requirements for training, control security and generalizability. Here we address these challenges by proposing the MERLIN framework and using a digital twin of a real-world 17-building grid-interactive residential community in CityLearn. We show that 1) independent RL-controllers for batteries improve building and district level KPIs compared to a reference RBC by tailoring their policies to individual buildings, 2) despite unique occupant behaviours, transferring the RL policy of any one of the buildings to other buildings provides comparable performance while reducing the cost of training, 3) training RL-controllers on limited temporal data that does not capture full seasonality in occupant behaviour has little effect on performance. Although, the zero-net-energy (ZNE) condition of the buildings could be maintained or worsened as a result of controlled batteries, KPIs that are typically improved by ZNE condition (electricity price and carbon emissions) are further improved when the batteries are managed by an advanced controller.

translated by 谷歌翻译

Effects of language mismatch in automatic forensic voice comparison using deep learning embeddings

Dávid Sztahó , Attila Fejes

分类：自然语言处理

2022-09-26

在法医语音比较中，扬声器的嵌入在过去十年中已广泛流行。大多数审计的扬声器嵌入式嵌入都经过英语语料库进行培训，因为它很容易访问。因此，语言依赖性可能是自动法医语音比较的重要因素，尤其是当目标语言在语言上非常不同时。有许多商业系统可用，但是它们的模型主要接受与目标语言不同的语言（主要是英语）的培训。在低资源语言的情况下，开发用于法医目的的语料库，其中包含足够的扬声器来训练深度学习模型是昂贵的。这项研究旨在调查是否可以在目标低资源语言（匈牙利语）上使用预先培训的英语语料库的模型，与模型不同。另外，通常没有犯罪者（未知的扬声器）获得多个样本。因此，在有或没有说话者入学率的嫌疑人（已知）扬声器的情况下对样品进行比较。应用了两个语料库，这些语料库是专门用于法医目的的，第三个是用于传统演讲者验证的第三个语料库。使用了两种基于深度学习的扬声器嵌入向量提取方法：X-Vector和Ecapa-TDNN。说话者验证在可能性比率框架中进行了评估。在语言组合（建模，LR校准，评估）之间进行了比较。通过MinCllr和EER指标评估了结果。发现该模型以不同的语言进行了预先训练，但是在具有大量扬声器的语料库上，在语言不匹配的样本上表现良好。还检查了样本持续时间和口语样式的影响。发现相关样本的持续时间越长，性能就越好。另外，如果采用各种口语样式，则没有真正的区别。

translated by 谷歌翻译

The cost of passing -- using deep learning AIs to expand our understanding of the ancient game of Go

Attila Egri-Nagy , Antti Törmänen

分类：人工智能 | 机器学习

2022-08-24

使用深度学习神经网络的AI发动机为分析传统棋盘游戏提供了出色的工具。在这里，我们有兴趣获得对古老游戏的新见解。为此，我们需要根据发动机的原始输出来定义新的数值度量。在本文中，我们开发了一种数值工具，用于以上下文敏感的方式进行自动移动性能评估并识别游戏功能。我们通过传递成本来衡量移动的紧迫性，这是石头当前配置和在同一董事会位置的假设传递之后的得分值差。在这里，我们研究了此度量的属性并描述了一些应用。

translated by 谷歌翻译

Towards Using Fully Observable Policies for POMDPs

András Attila Sulyok , Kristóf Karacs

分类：机器学习 | 人工智能

2022-07-24

部分可观察到的马尔可夫决策过程（POMDP）是适用于许多现实世界问题的框架。在这项工作中，我们提出了一种方法，通过依靠解决完全可观察的版本的策略来解决具有多模式信念的POMDP。通过deleinig，基于完全可观察到的变体的值函数的新的混合价值函数，我们可以使用相应的贪婪策略来求解POMDP本身。我们开发了讨论所需的数学框架，并引入了基于侦察盲tictactoe的任务的基准。在此基准测试中，我们表明我们的政策优于政策，而忽略了多种模式的存在。

translated by 谷歌翻译

Learning Mutual Fund Categorization using Natural Language Processing

Dimitrios Vamvourellis , Mate Attila Toth , Dhruv Desai , Dhagash Mehta , Stefano Pasquali

分类： (统计)机器学习

2022-07-11

长期以来，共同基金或交易所交易基金（ETF）的分类已为财务分析师提供服务，以进行同行分析，以从竞争对手分析开始到量化投资组合多元化。分类方法通常依赖于从n-1a表格中提取的结构化格式的基金组成数据。在这里，我们启动一项研究，直接从使用自然语言处理（NLP）的表格中描绘的非结构化数据中学习分类系统。将输入数据仅作为表格中报告的投资策略描述，而目标变量是Lipper全球类别，并且使用各种NLP模型，我们表明，分类系统确实可以通过高准确率。我们讨论了我们发现的含义和应用，以及现有的预培训架构的局限性在应用它们以学习基金分类时。

translated by 谷歌翻译

Segmentation-free PVC for Cardiac SPECT using a Densely-connected Multi-dimensional Dynamic Network

Huidong Xie , Zhao Liu , Luyao Shi , Kathleen Greco , Xiongchao Chen , Bo Zhou , Attila Feher , John C. Stendahl , Nabil Boutagy , Tassos C. Kyriakides

分类：计算机视觉 | 机器学习

2022-06-24

在核成像中，有限的分辨率会导致影响图像清晰度和定量准确性的部分体积效应（PVE）。已证明来自CT或MRI的高分辨率解剖信息的部分体积校正（PVC）已被证明是有效的。但是，这种解剖学引导的方法通常需要乏味的图像注册和分割步骤。由于缺乏具有高端CT和相关运动伪像的混合体SPECT/CT扫描仪，因此很难获得准确的分段器官模板，尤其是在心脏SPECT成像中。轻微的错误注册/错误分段将导致PVC后的图像质量严重降解。在这项工作中，我们开发了一种基于深度学习的方法，用于快速心脏SPECT PVC，而无需解剖信息和相关的器官分割。所提出的网络涉及密集连接的多维动态机制，即使网络经过充分训练，也可以根据输入图像对卷积内核进行调整。引入了心脏内血容量（IMBV）作为网络优化的附加临床损失函数。提出的网络表明，使用Technetium-99M标记的红细胞在GE发现NM/CT 570C专用心脏SPECT扫描仪上获得的28个犬类研究表现有希望的表现。这项工作表明，与没有这种机制的同一网络相比，具有密集连接的动态机制的提议网络产生了较高的结果。结果还表明，没有解剖信息的提出的网络可以与解剖学引导的PVC方法产生的图像产生具有统计上可比的IMBV测量的图像，这可能有助于临床翻译。

translated by 谷歌翻译

Modelling continual learning in humans with Hebbian context gating and exponentially decaying task signals

Timo Flesch , David G. Nagy , Andrew Saxe , Christopher Summerfield

分类：机器学习

2022-03-22

人类可以通过最小的相互干扰连续学习几项任务，但一次接受多个任务进行培训时的表现较差。标准深神经网络相反。在这里，我们提出了针对人工神经网络的新型计算限制，灵感来自灵长类动物前额叶皮层的较早作品，以捕获交织训练的成本，并允许网络在不忘记的情况下按顺序学习两个任务。我们通过两个算法主题，所谓的“呆滞”任务单元和HEBBIAN训练步骤增强了标准随机梯度下降，该步骤加强了任务单元和编码与任务相关信息的隐藏单元之间的连接。我们发现，“缓慢”的单元在培训期间引入了转换成本，该单元在交错训练下偏向表示的表示，而忽略了上下文提示的联合表示，而Hebbian步骤则促进了从任务单元到隐藏层的门控方案的形成这会产生正交表示，完全防止干扰。在先前发布的人类行为数据上验证该模型表明，它与接受过封锁或交错课程训练的参与者的表现相匹配，并且这些绩效差异是由真实类别边界的误解驱动的。

translated by 谷歌翻译

A general technique for the estimation of farm animal body part weights from CT scans and its applications in a rabbit breeding program

Ádám Csóka , György Kovács , Virág Ács , Zsolt Matics , Zsolt Gerencsér , Zsolt Szendrő , István Nagy , Örs Petneházy , Imre Repa , Mariann Moizs

分类：计算机视觉 | 机器学习

2021-12-30

农场动物成像的各种应用基于某些身体部位的重量和从动物的CT图像切割的估计。在许多情况下，由于扫描非镇静的活动物，通过CT图像中的姿势的巨大变化来增加问题的复杂性。在本文中，我们提出了一种估计来自（可能）活体动物的CT图像的切割和身体部位的重量的一般和鲁棒方法。我们通过弹性登记和联合功能和用于斗篷的回归分量的模型选择，适应基于多标准的分段以及具有大量特征和较少量的样本。通过兔育种程序中的真实应用来评估和说明所提出的技术，显示R ^ 2比以前的技术和方法高于以前的技术和方法。所提出的技术很容易适应类似的问题，因此，它在开源软件包中共享，以便为社区的利益。

translated by 谷歌翻译

NetKet 3: Machine Learning Toolbox for Many-Body Quantum Systems

Filippo Vicentini , Damian Hofmann , Attila Szabó , Dian Wu , Christopher Roth , Clemens Giuliani , Gabriel Pescia , Jannes Nys , Vladimir Vargas-Calderon , Nikita Astrakhantsev

分类：机器学习

2021-12-20

我们介绍了Netket的版本3，机器学习工具箱适用于许多身体量子物理学。Netket围绕神经网络量子状态构建，并为其评估和优化提供有效的算法。这个新版本是基于JAX的顶部，一个用于Python编程语言的可差分编程和加速的线性代数框架。最重要的新功能是使用机器学习框架的简明符号来定义纯Python代码中的任意神经网络ANS \“凝固的可能性，这允许立即编译以及渐变的隐式生成自动化。Netket 3还带来了GPU和TPU加速器的支持，对离散对称组的高级支持，块以缩放多程度的自由度，Quantum动态应用程序的驱动程序，以及改进的模块化，允许用户仅使用部分工具箱是他们自己代码的基础。

translated by 谷歌翻译